Model Selection

Lightweight Vision Model

# Lightweight Vision Model

Devstral Small Vision 2505 GGUF

Vision encoder based on Mistral Small model, supports image-text generation tasks, compatible with llama.cpp framework

LSNet is a family of lightweight vision models inspired by the dynamic multi-scale capabilities of the human visual system, achieving a balance between performance and efficiency across various vision tasks.

Image Classification

Sam2 Hiera Small.fb R896 2pt1

SAM2 weights (HieraDet image encoder only) based on the timm library, derived from Facebook's Hiera small model.

Image Segmentation

Cat Emotion Classifier

Fine-tuned version of Google's ViT model for cat emotion classification

Image Classification

Autotrain Test 41086106044

A multi-class image classification model trained using AutoTrain, capable of classifying common objects

Image Classification

Swin Tiny Patch4 Window7 224 Finetuned Eurosat

An image classification model based on the Swin Transformer Tiny architecture, fine-tuned on the CIFAR10 dataset with an accuracy of 97.24%

Image Classification

Autotrain Ex And Pt 3122688390

A multi-class image classification model trained using AutoTrain, capable of recognizing and classifying various common objects

Image Classification

Autotrain Ex And Pt 3122688386

This is a multi-class image classification model trained using AutoTrain, capable of recognizing common objects such as tigers, teapots, and palaces.

Image Classification

Swin Tiny Patch4 Window7 224 Finetuned Eurosat

Image classification model fine-tuned on the CIFAR10 dataset based on Swin Transformer Tiny architecture

Image Classification

Vit Base Patch16 224 Finetuned

An image classification model fine-tuned based on Google's Vision Transformer (ViT), trained on custom image datasets

Image Classification

Swin Tiny Patch4 Window7 224 Finetuned Woody LeftGR 130epochs

Image classification model based on Swin Transformer Tiny architecture, fine-tuned for 130 epochs on a specific image dataset

Image Classification

Levit 192 Finetuned On Unlabelled IA With Snorkel Labels

This model is a fine-tuned version of facebook/levit-192 on an unlabeled dataset, demonstrating excellent performance in precision, recall, F1 score, and accuracy.

Image Classification

Swin Tiny Finetuned Dogfood

A dog food image classification model fine-tuned based on Swin Transformer Tiny architecture, achieving 98.8% accuracy on the test set

Image Classification

Snacks Classifier

A lightweight image classification model based on Microsoft's Swin Transformer Tiny architecture, achieving 92.86% test accuracy after fine-tuning on a snack classification dataset

Image Classification

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase